Кластеризация в аналитике больших данных: системный обзор и сравнительный анализ (обзорная статья)
Аннотация:
В современном мире широкое использование информационных и коммуникационных технологий привело к накоплению огромных и разнообразных объемов данных, широко известных как большие данные. Это обуславливает потребность в новых концепциях и аналитических методах, которые помогают извлекать важные идеи из быстро растущих объемов цифровых данных. Кластеризация — фундаментальный подход, используемый в интеллектуальном анализе данных для извлечения ценной информации. Несмотря на то, что в различных областях описано и реализовано множество методов кластеризации, данное разнообразие усложняет задачу отслеживания последних достижений в области больших данных. Работа направлена на всестороннюю оценку алгоритмов кластеризации, разработанных для больших данных, с выделением их различных функций. Выполнены эмпирические оценки шести больших наборов данных с использованием нескольких показателей достоверности и времени вычислений для оценки производительности рассматриваемых методов кластеризации.
Ключевые слова:
Постоянный URL
Статьи в номере
- Разработка адаптивной лазерной головки для компенсации погрешности положения перетяжки пучка во время лазерной обработки с использованием метода обнаружения пятна лазерного излучения
- Исследование изменения чувствительности волоконной брэгговской решетки к температуре и растяжению с помощью нанесения покрытий из легкоплавких металлов
- Исследование влияния наведенного периодического механического напряжения на величину связи поляризационных мод в двулучепреломляющем оптическом волокне
- Метод поиска функции Ляпунова для анализа устойчивости нелинейных систем с использованием генетического алгоритма
- Робастная компенсация возмущений для многоканальных линейных систем с неизмеримым вектором состояния и запаздыванием в канале управления
- Управление отслеживанием траектории для мобильных роботов с адаптивным коэффициентом усиления
- Переключение электрических свойств тонкопленочных мемристивных элементов на основе GeTe последовательностями сверхкоротких лазерных импульсов
- Спектральные и кинетические характеристики свернутых в виде свитков ультратонких нанопластин селенида кадмия
- Метод оптимизации параметров установки камеры для видеоконтроля зоны наблюдения произвольной формы
- Использование антропометрических точек для внесения ограничений в синтез трехмерной модели тела человека с помощью SMPL
- Метод тестирования лингвистических моделей машинного обучения текстовыми состязательными примерами
- Новый эффективный адаптивный алгоритм шаблонного поиска для оценки движения
- Сегментация жестов слов на видео жестового языка
- Метод построения интерпретируемых скрытых марковских моделей для задачи поиска связываемых участков пептидов в последовательностях белков
- Планирование заданий в распределенной вычислительной системе на кристалле с минимизацией потребляемой мощности
- Система маршрутизации клиентов на основе их эмоционального состояния и возраста в системах обслуживания населения
- Последствия малоподвижного поведения для здоровья и выявление неопределенных моделей поведения у взрослых
- Доверительные липшицевы классификаторы: инструмент гарантированной надежности
- Среда визуальной разработки программ многомерных нечетких интервально-логических регуляторов
- Решение задачи пространственного вращения 3D-поверхностей и их отображения на плоскости
- Аналитическое и имитационное моделирование гибких сочленений для мехатронных и робототехнических систем
- Оценка влияния степени заполнения реакционного тигля железо-олово на процессы тепло- и массопереноса в присутствии электрического тока высокой плотности
- Измерение показателя преломления с помощью автоколлимационного гониометра